- 快捷搜索
- 全站搜索

从图l可以看出,数据质量问题可以归纳为“2+1”问题。“2”指的是数据质量的两个方面,即数据内在质量和数据过程质量;l指的是一个整体的数据管理体系,从整体对数据质量进行规划、评估、控制。
1.提高数据内在质量
数据内在质量就是指数据自身属性的质量。数据内在质量可以反映在以下几个方面。
(1)数据真实性
数据真实性是指数据是否真实的反应了现实存在,数据代表的是在业务处理过程中真实存在的客观事物或者属性。
(2)数据完整性
数据完整性是指一组相关数据代表的是一个完整的事物,缺少某一项数据对这个事物来说是错误的或者与现实相违背的。
(3)数据精确性
数据精确性是指数据应该达到业务要求的精度,比如时间戳的毫秒精确位数,或者double数据类型的小数点位数,如果达不到要求则对业务来说毫无意义,只能是“废”数据。
(4)数据时效性
数据时效性是指数据必须在规定的时间内提供,或者在一定的时间段内是有效的,这样及时的数据对业务来说才是有帮助的,如果超过这个时间假定,则是无用的,甚至是有害的。
(5)数据可用性
数据可用性是指每项数据是清晰的代表具体业务含义的,能被业务人员方便使用,或者可以被系统方便的进行提取和分析的。比如某个数据项包含大量的组合意义的信息,业务人员无法清晰地了解数据含义,软件系统也无法方便的进行解析,则可以说这个数据项可用性差甚至没有可用性。
(6)数据可信性
数据可信性是指数据的来源是可靠的,数据的整个流动环节也是可处理的,比如通过加密手段进行传输加密,防止中间环节被窃取修改。
(7)数据逻辑一致性
数据逻辑一致性是指某项数据对于很多业务实体都是有意义的或者必不可少的,如果一处发生了变更,则要同时发生变更,否则会造成系统的其他地方出现错误。
2.从全行范围内考虑
从全行范围内在数据生命周期的每个环节提高数据质量,主要包括以下几个方面。
(1)数据分析质量
在进行需求分析时,一定要对业务人员描述的业务流程进行深入分析,反复确认业务人员眼中的数据究竟是什么样子,屏蔽业务人员口中常用的非标准术语,取之以公共的、带有明确含义的业务词汇定义并与业务人员达成共识,只有这样,才能消除因为理解偏差而造成的数据源头不准确的现象。
(2)数据设计质量
系统设计之初,必须首先建立数据标准,明确数据定义。通过清晰地定义系统中使用的数据编码和数据的含义,避免不同系统甚至同一系统的不同模块中使用不同的数据编码来表示相同的数据,或者相同的数据编码表示不同的数据。最好设立全行级的数据定义控制小组,对增加、修改、删除数据定义进行全面评估,谨慎对待系统每一个要变更的元数据,只有这样,才能避免后续系统无法有效进行数据集中的问题。
当前,商业银行灾备中心建设与运营主要采用自建、共建和外包三种模式。哪种
央行和银监会对中小银行的灾备布局建设十分重视,构建同城灾备中心,发挥其